深度Q网络相关论文
随着科技的不断进步,越来越多的机器人被应用在各种各样的场景中,移动机器人作为智能机器人的重要分支,其路径规划问题一直是国内......
由于传统基于固定加工环境的工艺路线制定规则,无法快速响应加工环境的动态变化制定节能工艺路线。因此提出了基于深度Q网络(deep Q ......
近年来,人工智能的迅速发展,极大改变了人们的生活和工作方式。车、船等载运工具的智能化自主操控,也受到越来越多的关注。区别于......
为适应航运业的快速发展并减少因人为因素导致的船舶碰撞事故发生,文章提出一种基于深度强化学习的深度Q神经网络的船舶避碰决策算......
针对现有的路径规划算法效率低的问题,根据奖励函数和多层感知机提出一种基于深度强化学习的路径规划算法。考虑到环境的复杂程度,为......
无人驾驶汽车由于其有限的电池寿命和计算能力,难以在保证续航的前提下满足一些时延敏感任务或密集任务的处理需求。为解决该问题,在......
面对高维连续状态空间或稀疏奖励等复杂任务时,仅依靠深度强化学习算法从零学习最优策略十分困难,如何将已有知识表示为人和学习型......
为了减少制造成本、提高焊接效率,让机器人能适应不同形状的焊缝,具备类似人一样的自主学习和决策能力,提出将基于强化学习的路径规划......
伴随网络技术及其应用的快速发展,各类网络应用如雨后春笋般涌现,网络流量的模式特征也变得愈发复杂,传统基于规则匹配的入侵检测......
近年来,无人机辅助物联网中数据收集的方法被广泛应用,相比于传统的静态数据收集方法,无人机辅助数据收集的方法克服了地表交通的......
在下行多小区非正交多址接入系统中,功率分配是决定系统性能的关键因素之一。由于多小区系统间的功率优化问题的非凸性,获得最优功率......
随着数据库技术和计算机硬件的发展,当前数据库运行的平台已逐渐转移到多核处理器和大容量的低延迟存储所构成的硬件平台上,由此产......
当今网络通信环境下,接入网络的各种智能设备和移动用户数量急剧增长,频谱资源稀缺的问题也愈加突出。相比传统的正交多址接入(OMA),......
我国于2015年发布了《中国制造2025》计划,其中工业自动化中的机械臂作为主要的技术领域被重点关注。现代工业中机械臂应用还停留......
近年来,随着视频流、移动计算、虚拟现实游戏等技术的广泛应用,对移动实时带宽提出了更高的要求,由于当前4G蜂窝通信技术不能承载......
在深度强化学习中,智能体需要与环境进行交互学习,这就需要智能体能够很好地去平衡利用与探索.因此如何提升算法的样本有效性,增加......
轮廓误差是在机床加工曲线及曲面时一定会产生的,严重影响着工件的加工质量。轮廓误差的预测和补偿是提高CNC机床轮廓性能以实现更......
随着机器人在实际生活中的应用越来越广泛,机器人的智能化发展也在人们对生活中起到了十分重要的作用。在控制机械臂进行物体抓取......
作为一种脑部疾病,脑卒中是当前临床医学上最常见的疾病之一,具有高致死率和致残率等特点。引发脑卒中的风险因素众多,发病前高效......
深度强化学习(Deep Reinforcement Learning,DRL)可广泛应用于城市交通信号控制领域,但在现有研究中,绝大多数的DRL智能体仅使用当前的......
本文研究了不同深度强化学习算法在医疗应用-虚拟手术室中的表现。通过观察分析,创新性的建立了一个虚拟环境系统,目的是探究智能......
伴随着无线设备的快速发展,现如今越来越多的车辆都配备有大量的无线设备,使利用大规模的车载网络成为了可能,因此,工业界和学术界......
车间调度是对整个生产车间进行控制、优化与管理的核心环节。基于动态作业车间的有效调度算法可以降低制造成本,缩短产品交付时间,......
目前智能决策系统中的经典算法智能化程度较低,而更为先进的强化学习算法应用于复杂决策任务又会导致存储上的维度灾难问题.针对该......
针对现有深度强化学习算法在状态空间维度大的环境中难以收敛的问题,提出了在时间维度上提取特征的基于一维卷积循环网络的强化学......
在移动边缘计算的应用场景下,边缘服务器可以提供计算和存储服务。移动设备能够将任务卸载到边缘服务器上进行执行,以加速整体的执......
4G的普及带来了移动互联网时代,联网设备的主力军从个人电脑(Personal Computer,PC)逐渐转变成手机平板等移动终端。随着5G的研究与......
深度强化学习具有深度学习和强化学习的双重优势,不但理论取得重大突破,而且获得实际应用。随着机器人应用领域的广泛,工作环境更......
目前异常用电检测问题有许多基于分类的方法,但大多都是基于短期用电行为的判决来判断长期用电行为,判决阈值与比例难以确定,且在......
深度强化学习立足于解决环境交互问题,实现智能体的连续序列决策.传统强化学习算法基于马尔科夫决策过程,未来的状态仅与当前的状......
针对当前反无人系统无法有效压制无人机的问题,使用多种拦截装备构建一种新的反无人机方法.传统多目标优化算法无法解决动态的任务......
机组组合是电力系统经济调度中的关键问题.机组组合问题属于复杂混合整数非线性优化问题,大多数优化算法在求解速度、求解效率、计......
无人作战飞机(unmanned combat aerial vehicle,UCAV)在进行空战自主机动决策时,面临大规模计算,易受敌方不确定性操纵的影响.针对......
由于传统车间调度方法实时响应能力有限,难以在复杂调度环境中取得良好效果,提出一种基于深度Q网络的深度强化学习算法.该方法结合......
为解决移动机器人仓储系统中的多AGV无冲突运动规划问题,建立了马尔可夫决策过程(MDP)模型,提出了一种新的基于深度Q网络(DQN)的求解方法......
针对5G网络资源状态动态变化和网络模型高维度下服务功能链部署的复杂性问题,该文提出一种基于深度Q网络的在线服务功能链部署方法......
为实现海战场环境下多智能体路径规划及目标追踪,以智能体(潜艇或者舰艇)为研究对象,提出一种基于强化学习的深度Q网络算法.通过设......
深度强化学习算法能够很好地实现离散化的决策行为,但是难以运用于高度复杂且行为连续的现代战场环境,同时多智能体环境下算法难以......
为了提高强化学习算法训练过程中信息价值高样本的回放频率,缩短算法训练时间,本文提出一种二次采样方法。对经验池中随机采集批量......
为了提高强化学习算法训练过程中信息价值高样本的回放频率,缩短算法训练时间,本文提出一种二次采样方法.对经验池中随机采集批量......
针对快速搜索随机树(rapidly-exploring random tree,RRT)路径规划算法存在的随机性大、搜索效率低等问题,结合强化学习可根据先验......
针对无线网络环境中多用户之间冲突及干扰影响问题,本文利用马尔可夫框架进行建模分析,提出了一种多用户联合抗干扰决策算法(MJADA......